Υποχρεωτικό
Εξόρυξη Γνώσης και Μηχανική Μάθηση
- ΜΑΘΗΣΙΑΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ
-
Σκοπός του μαθήματος είναι η γνωριμία των φοιτητών και των φοιτητριών με έννοιες που αφορούν την εξόρυξη γνώσης από δεδομένων και τη μηχανική μάθηση. Πιο συγκεκριμένα, στόχοι του μαθήματος αποτελούν το να βοηθήσει τους φοιτητές και τις φοιτήτριες:
- Να γνωρίσουν τις εφαρμογές Εξόρυξης Γνώσης και Μηχανικής Μάθησης καθώς και τα στάδια της Εξόρυξης Γνώσης από ∆εδομένα (Knowledge Discovery in Databases)
- Να εφαρμόζουν τις κατάλληλες τεχνικές προ-επεξεργασίας δεδομένων με στόχο την προετοιμασία των δεδομένων για Εξόορυξη Γνώσης και την εφαρμογή αλγορίθμων Μηχανικής Μάθησης
- Να κατανοήσουν τον τρόπο λειτουργίας διάφορων αλγορίθμων κατηγοριοποίησης (εποπτευμένη μάθηση), συσταδοποίησης (μη εποπτευμένης μάθησης) και εξαγωγής κανόνων συσχέτισης
- Να εκτιμούν την απόδοση των αλγορίθμων εξόρυξης γνώσης και μηχανικής μάθησης χρησιμοποιώντας τις κατάλληλες τεχνικές επικύρωσης και να αξιολογούν την παραγόμενα αποτελέσματα με στόχο τη λήψη αποφάσεων
- Να σχεδιάζουν και να υλοποιούν Αποθήκες ∆εδομένων και εφαρμόζουν αναλυτική επεξεργασία τύπου OLAP και αλγορίθμους εξόρυξης γνώσης σε αυτές
- ΓΕΝΙΚΕΣ ΙΚΑΝΟΤΗΤΕΣ
-
- Αναζήτηση, ανάλυση και σύνθεση δεδομένων και πληροφοριών, με τη χρήση και των απαραίτητων τεχνολογιών
- Λήψη αποφάσεων
- Αυτόνομη ή και ομαδική εργασία
- Προαγωγή της ελεύθερης, δημιουργικής και επαγωγικής σκέψης
- ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ
-
Σύντομη περιγραφή
- Εισαγωγή στην εξόρυξη γνώσης και τη μηχανικής μάθηση.
- Προετοιμασία δεδομένων (Καθαρισμός δεδομένων, διαχείριση απούσων τιμών, επιλογή χαρακτηριστικών, διακριτοποίηση, διαχείριση ανισοκατανομών σε προβλήματα κατηγοριοποίησης κ.α.)
- Εισαγωγή στην κατηγοριοποίηση/εποπτευμένη μάθηση, Κατηγορίες αλγορίθμων κατηγοριοποίησης, Αλγρόριθμοι που βασίζονται σε πιθανότητες (π.χ. naive bayes), Αλγόριθμοι που βασίζονται στον διαχωρισμό του χώρου (π.χ. ∆ένδρα αποφάσεων), Αλγόριθμοι που βασίζονται στην ομοιότητα/απόσταση (κ εγγύτεροι γείτονες), αποτελεσματική αναζήτηση εγγύτερων γειτόνων μέσω δεικτοδότησης δεδομένων (π.χ. kdtree), τεχνικές μείωσης δεδομένων εκπαίδευσης.
- Εισαγωγή στην συσταδοποίησης/μη εποπτευμένη μάθηση, Αλγόριθμοι Συσταδοποίησης: Ο αλγόριθμος κ μέσων (k-means) και οι παραλλαγές του, Ιεαραρχική συσταδοποίηση, συσταδοποίηση βάσει πυκνότητας (DBSCAN), τεχνικές προσδιορισμου παραμέτρων
- Μέτρηση της απόδοσης αλγορίθμων κατηγοριοποίησης και συσταδοποίησης
- Κανόνες συσχέτισης, Ο αλγόριθμος Apriori για την ανακάλυψη κανώνων συσχέτισης, μέτρα αξιολόγησης των κανόνων συσχέτισης
- Επεξεργασία τύπου OLTP και OLAP, σχεδίαση και υλοποίηση Αποθήκης ∆εδομένων, σχήμα αστέρα και χιονονιφάδας, διαδικασίες Extract-Transform-Load (ETL), πολυδιάστατοι κύβοι δεδομένων, αίτηματα OLAP και αλγόριθμοι εξόρυξης γνώσης σε κύβους δεδομένων.
- ΟΡΓΑΝΩΣΗ ΔΙΔΑΣΚΑΛΙΑΣ
-
Δραστηριότητα Φόρτος Εργασίας Εξαμήνου Διαλέξεις 39 Φροντιστηριακή διδασκαλία 13 Αυτοτελής μελέτη 98 Σύνολο μαθήματος 150 - ΑΞΙΟΛΟΓΗΣΗ ΦΟΙΤΗΤΩΝ
-
Το μάθημα αξιολογείται με γραπτή τελική εξέταση δίωρης διάρκειας, και πιθανή διαδικασία διαρκούς αξιολόγησης κατά την κρίση του διδάσκοντα. Η ακριβής διαδικασία αξιολόγησης ανακοινώνεται στους φοιτητές και αναρτάται στο eclass στην αρχή του εξαμήνου.
- ΣΥΝΙΣΤΩΜΕΝΗ ΒΙΒΛΙΟΓΡΑΦΙΑ
-
1. M. Dunham, Data Mining, Εκδόσεις νέων τεχνολογιών ΙΚΕ
2. Tan Pang - Ning,Steinbach Michael,Kumar Vipin, Βερύκιος Βασίλειος (επιμέλεια), Εισαγωγή στην εξόρυξη δεδομένων, Εκδόσεις: Α. ΤΖΙΟΛΑ & ΥΙΟΙ Α.Ε., 2018
3. Mohammed J. Zaki, Wagner Meira JR, Εξόρυξη και Ανάλυση ∆εδομένων: Βασικές Έννοιες και Αλγόριθμοι, Εκδόσεις Κλειδάριθμος
4. Anand Rajaraman, Jeffrey David Ullman, Εξόρυξη από Μεγάλα Σύνολα ∆εδομένων, Εκδόσεις Νέων Τεχνολογιών ΙΚΕ
5. Αλ. Νανόπουλος, Γ. Μανωλόπουλος, Εισαγωγή στην Εξόρυξη ∆εδομένων και τις Αποθήκες ∆εδομένων, Εκδόσεις Νέων Τεχνολογιών, 2008 - ΗΛΕΚΤΡΟΝΙΚΗ ΣΕΛΙ∆Α ΜΑΘΗΜΑΤΟΣ ΣΤΟ ECLASS